63 research outputs found

    Statistical models for inferring the structure and history of populations from genetic data

    Get PDF
    Population genetics has enjoyed a long and rich tradition of applying mathematical, computational and statistical methods. The connection between these fields has deepened in the last few decades as advances in genotyping technology have led to an exponential increase in the amount of genetic data allowing fundamental questions involving the nature of genetic variation to be asked. The massive quantities of data have necessitated the development of new mathematical and statistical models along with computational techniques to provide answers to these questions. In this work we address two problems in population genetics by constructing statistical models and analyzing their performance with simulated and real data. The first one concerns the identification of genetic structure in natural populations from molecular data, which is an important aspect in many fields of applied science, including genetic association mapping and conservation biology. We frame it as a problem of clustering and classification and utilize background information to achieve a higher accuracy, when the genetic data is sparse. We develop a computationally efficient method for taking advantage of geographical sampling locations of the individuals. The method is based on the assumption that the spatial structure of the populations correlates strongly with the genetic structure, which has been proven reasonable for human populations. In the assignment of individuals into known populations, we also show how improvements in the efficiency of the inference can be obtained by considering all of the individuals jointly. The result is derived in the context of classification, which is major field of study in machine learning and statistics, making it applicable in a wide range of situations outside population genetics. The other problem involves the reconstruction of evolutionary processes that have resulted in the structure present in current populations. The genetic variation between populations is caused to large extent by genetic drift, which corresponds to random fluctuations in the distribution of a genetic type due to demographic processes. Depending on the genetic marker under study, mutation has only a minor or even negligible role, in contrast with traditional phylogenetic methods, where mutational processes dominate as the time scales are longer. We follow the change in the relative frequencies of different genetic types in populations by deriving approximations to widely used models in population genetics. The direct modeling of population level properties allows the method to be applied data sets harboring thousands of samples, as demonstrated by the analysis of global population structure of Streptococcus pneumoniae.Populaatiogenetiikka tutkii perinnöllisen vaihtelun esiintymistä ja muutosta populaatioissa, jotka ovat samaan lajiin kuuluvien yksilöiden muodostamia yhteisöjä. Keskeisen osa populaatiogenetiikan kehityksessä on ollut matemaattisilla, tilastollisilla ja laskennallisilla menetelmillä. Tämä yhteys on vahvistunut viime aikoina samalla kun uudet sekvensointimenetelmät ovat johtaneet geneettisten aineistojen määrän räjähdysmäiseen kasvuun. Geneettisen materiaalin selvittämisen helppous on luonut tarpeen kehittää uusia laskennallisia menetelmiä, joilla pystytään tehokkaasti tutkimaan perinnöllisen vaihtelun luonnetta populaatioissa. Väitöskirjassa luodaan tilastollisia malleja vastaamaan kahteen populaatiogenetiikassa esiin nousevaan kysymykseen. Ensimmäinen näistä koskee luonnonpopulaatioiden geneettisen rakenteen oppimista, joka on tärkeä osa monilla eri tieteen osa-alueille. Ongelma muotoillaan käyttäen tilastotieteessä ja koneoppimisessa laajasti tutkittuja ryhmittelyn ja luokittelun käsitteitä. Työssä kehitetään laskennallisesti tehokkaita menetelmiä muun saatavilla olevan informaation, kuten yksilöiden maantieteellisten havaintopaikkojen, hyödyntämiseen geneettisen aineiston ohella. Toinen ongelma liittyy niiden historiallisten prosessien selvittämiseen, jotka ovat johtaneet nykyiseen geneettiseen rakenteeseen havaituissa populaatioissa. Geneettinen vaihtelu läheisten populaatioiden välillä on usein seurausta eri perintötekijöiden satunnaisesta sekoittumisesta, kun taas mutaatioiden luomilla uusilla muodoilla on pieni tai merkityksetön rooli. Väitöskirjassa johdetaan tätä satunnaisvaihtelua kuvaaville malleille approksimaatioita, jotka mahdollistavat tuhansia yksilöitä kattavien aineistojen analyysin

    Johtajaidentiteetin hidas muutos edesauttaa inhimillisesti tehokasta johtamista organisaatioiden yhdistämisessä

    Get PDF

    Reply

    Get PDF

    Haimasyövän ennuste paranee : Aiempaa useampi haimasyöpä on leikattavissa

    Get PDF
    Teema : maksa- , haima- ja sappitiekirurgi

    Enhanced Bayesian modelling in BAPS software for learning genetic structures of populations

    Get PDF
    BACKGROUND: During the most recent decade many Bayesian statistical models and software for answering questions related to the genetic structure underlying population samples have appeared in the scientific literature. Most of these methods utilize molecular markers for the inferences, while some are also capable of handling DNA sequence data. In a number of earlier works, we have introduced an array of statistical methods for population genetic inference that are implemented in the software BAPS. However, the complexity of biological problems related to genetic structure analysis keeps increasing such that in many cases the current methods may provide either inappropriate or insufficient solutions. RESULTS: We discuss the necessity of enhancing the statistical approaches to face the challenges posed by the ever-increasing amounts of molecular data generated by scientists over a wide range of research areas and introduce an array of new statistical tools implemented in the most recent version of BAPS. With these methods it is possible, e.g., to fit genetic mixture models using user-specified numbers of clusters and to estimate levels of admixture under a genetic linkage model. Also, alleles representing a different ancestry compared to the average observed genomic positions can be tracked for the sampled individuals, and a priori specified hypotheses about genetic population structure can be directly compared using Bayes' theorem. In general, we have improved further the computational characteristics of the algorithms behind the methods implemented in BAPS facilitating the analyses of large and complex datasets. In particular, analysis of a single dataset can now be spread over multiple computers using a script interface to the software. CONCLUSION: The Bayesian modelling methods introduced in this article represent an array of enhanced tools for learning the genetic structure of populations. Their implementations in the BAPS software are designed to meet the increasing need for analyzing large-scale population genetics data. The software is freely downloadable for Windows, Linux and Mac OS X systems at

    Monilähdetietoa hyödyntävien karttaopasteiden tarve puunkorjuussa : Haastattelututkimus hakkuukoneenkuljettajille

    Get PDF
    Uudet julkiset suurten tietomassojen paikkatietoaineistot ja menetelmät maaston ja puuston kuvaamiseksi mahdollistavat tiedon uudenlaisen hyödyntämisen puunhankinnan suunnittelussa ja toteutuksessa. Tutkimuksen päätavoitteena oli selvittää hakkuukoneenkuljettajien näkemys uusien, monilähdetietoa hyödyntävien opastavien karttasovellusten tarpeesta ja merkityksestä koneellisessa hakkuussa. Päätavoitteen lisäksi tutkimuksessa selvitettiin kokonaiskuvaa haastateltavien työstä, työn suunnittelusta ja siihen vaadittavasta informaatiosta. Tutkimuksessa haastateltiin 24 hakkuukoneenkuljettajaa, joilla oli pitkä kokemus (ka 15,7 vuotta) koneellisesta hakkuusta. Hakkuun suunnittelun suurimpina tiedontarpeina oli kohteen kulkukelpoisuustiedon ja leimikon erityiskohteiden esittäminen. Tiedon tarve kasvoi maastoltaan vaikeilla kohteilla sekä pimeään ja lumipeitteiseen talviaikaan hakattaessa. Myös tiedon tarve koneen komponenttien kunnosta koettiin suureksi. Kuljettajien ensikokemuksen perusteella muodostunut näkemys esitetyistä karttaopasteista oli varsin positiivinen. Merkitykseltään suurimmiksi koettiin jo käytössä olevat karttapohjat, kuten peruskartta ja ilmavalokuva. Kulkukelpoisuutta, sekä kantavuutta että rinnejyrkkyyksiä, esittäneet karttaopasteet koettiin hyvin tarpeellisiksi. Erot karttaopasteiden välisissä merkityksissä olivat kuitenkin suhteellisen pienet ja kaikki esitetyt opasteet koettiin merkitykseltään vähintään kohtalaiselle tasolle. Maaston kulkukelpoisuutta kuvaavalla karttapohjalla esitetty ajouraennuste sai yli puolelta kuljettajista merkityksen suuri tai erittäin suuri vaikkakin useat epäilivät ajouraennusteen tarkkuutta ja luotettavuutta. Yleiskuvaksi voidaan muodostaa se, että muutama hyvä karttaopaste on riittävä ja kartalle esitettävä tieto tulisi olla visuaalisesti selkeä ja määrällisesti alhainen. Tiedon tarve ja karttapohjaisen opastuksen merkitys oli kuljettajien kokemustasosta riippumaton, joten opastavista karttajärjestelmistä olisi apua koko kuljettajakunnalle. Kun tarpeeseen sopivaa tarkkaa ja oikein esitettyä karttaopastetta saadaan käyttöön, se antaa mahdollisuuden parantaa paitsi työn tuottavuutta, myös työn jäljen laatua, harvennusten kasvukykyä, työturvallisuutta, koneiden käyttökuntoa sekä operaatioiden keston ennustettavuutta. Tarkkaan monilähdetietoon perustuvan karttapastuksen potentiaalin voidaan arvioida olevan 5–15 % nykytilan kustannustehokkuudesta koneellisessa puunkorjuussa. Tutkimus kuului DIGILE OY:n tutkimusohjelmaan “Data to Intelligence (D2I)”, ja se toteutettiin Forest Big Data-hankkeen Task 3:n “Intelligent and Self-learning Decision Support Systems” sisällä. Hanke toteutettiin yhteistyössä Ponsse Oyj:n, Luonnonvarakeskuksen ja Itä-Suomen Yliopiston kanssa.201

    Prediction and consequences of postoperative pancreatitis after pancreaticoduodenectomy

    Get PDF
    In this retrospective cohort study, 18 per cent of 508 patients undergoing pancreaticoduodenectomy had clinically relevant postoperative pancreatitis, which increased the overall morbidity of these patients. The available and validated fistula risk scores can also be used to predict the risk of postoperative pancreatitis. Background Recent studies have suggested postoperative acute pancreatitis (POAP) as a serious complication after pancreaticoduodenectomy (PD) and have speculated on its possible role in the pathogenesis of postoperative pancreatic fistula (POPF). This study aimed to assess the impact of POAP on post-PD outcomes and fistula risk score (FRS) performance in predicting POAP. Methods All PDs at Helsinki University Hospital between 2013 and 2020 were analysed. POAP was defined as a plasma amylase activity greater than the normal upper limit on postoperative day (POD) 1 and stratified as clinically relevant (CR)-POAP once C-reactive protein (CRP) reached or exceeded 180 mg/l, and non-CR-POAP once CRP was less than 180 mg/l on POD 2. The Comprehensive Complication Index (CCI) was used to assess total postoperative morbidity. Different FRSs were assessed using receiver operating characteristic curves. Results Of the 508 patients included, POAP occurred in 202 (39.8 per cent) patients, of whom 91 (17.9 per cent) had CR-POAP. The incidence of CR-POPF was 12.6 per cent (64 patients). Patients with non-CR-POAP had a similar morbidity to patients with no POAP (median CCI score 24.2 versus 22.6; P = 0.142), while CCI score was significantly higher (37.2) in patients with CR-POAP (P < 0.001). CR-POAP was associated with increased rates of CR-POPF, delayed gastric emptying, haemorrhage, and bile leak, while non-CR-POAP was associated only with CR-POPF. Ninety-day mortality was 1.6 per cent, 0.9 per cent, and 3.3 per cent in patients with no-POAP, non-CR-POAP, and CR-POAP, respectively. Updated alternative FRS showed the best performance in predicting CR-POAP (area under the curve 0.834). Conclusion CR-POAP was associated with a higher CCI score, suggesting CR-POAP as a distinct entity from non-CR-POAP. FRSs can be used to assess the risk of CR-POAP.Peer reviewe

    Three-dimensional versus two-dimensional high-definition laparoscopy in cholecystectomy: a prospective randomized controlled study

    Get PDF
    While 3D laparoscopy increases surgical performance under laboratory conditions, it is unclear whether it improves outcomes in real clinical scenarios. The aim of this trial was to determine whether the 3D laparoscopy can enhance surgical efficacy in laparoscopic cholecystectomy (LCC).Peer reviewe
    corecore